上一篇我們已將伊甸基金會的口罩臉孔資料集
上傳到 nilvana 的 Vision Studio 中, 在真正執行標註之前, 我們先來認識一下標註格式與常用的標註工具.
在圖檔之上想要做標註, 做法是針對每一個圖檔產生一個metadata, 這個metadata用來說明該圖檔的標註內容, 格式通常為XML或JSON. 因此做完標註之後會有兩個檔案
常見的標註格式如下:
以下說明COCO的標註操作方式(ps:Nilvana也支援COCO), 讓我們了解一下標註在做些什麼
首先我們使用CoCo annotator建立一個dataset, dataset的名稱是cars
, 而且我們建立三個label, 分別是wheel
、body
與window
.
然後在這個dataset之中加入一張圖片, 我們要在這張圖片加張一個標註框, 來看看標註檔會如何記錄我們加入的標註框資訊
我們在這張圖上加上一個BBox(bounding box).
標註好之後, 將資料匯出, 我們要下載標註資料
下圖點擊Donwload
即可下載標註資料
下載下來的標註資料是JSON格式, 分為三段說明(這個JSON可以在github下載)
圖檔資訊(images)
圖檔資訊用來描述圖檔本身的內容, 例如
標籤資訊(categories)
標籤資訊顯示的是我們在建立dataset時所設定的label(wheel, body, window), 而且也包含不同label會呈現的顏色.
標註資訊(annotations)
標註資訊呈現我們所拉的標註框資訊, 在前面我們只拉了一個BBox(bounding box), 所以在標註資訊中也呈現一個bbox
, 這個bbox由四個點所組成.
在範例中, 以一張圖檔加上標註框產生一個標註檔(JSON), 這是最基本的組成, 希望能協助大家了解標註檔的內容與功能.
https://github.com/jsbroks/coco-annotator
https://www.robots.ox.ac.uk/~vgg/software/via/
http://host.robots.ox.ac.uk/pascal/VOC/
http://dlib.net/
https://cocodataset.org/#format-data